#LiveCodeBench Pro24.06.2025
Кризис оценки ИИ: почему старые тесты не работают и что будет дальше
Традиционные бенчмарки перестают адекватно отражать реальные способности ИИ. Появляются новые методы оценки, такие как LiveCodeBench Pro и Xbench, которые предлагают более точное измерение возможностей моделей.